home *** CD-ROM | disk | FTP | other *** search
/ InfoMagic Internet Tools 1995 April / Internet Tools.iso / infoserv / www / cern / dev / www-talk.9301-9306.Z / www-talk.9301-9306 / text1181.txt < prev    next >
Encoding:
Text File  |  1995-04-24  |  3.2 KB  |  72 lines

  1. Announcing the availability of an experimental new service within the
  2. World Wide Web (WWW), the Unified Computer Science Technical Report
  3. Index.
  4.  
  5. WHAT IT IS
  6.  
  7. It's pretty simple, really.  A daemon runs and pulls index files from
  8. many various FTP sites which archive tech reports (and similar
  9. material.)  At present, 39 FTP sites are included in the index, with
  10. over 1,400 reports included; both of these numbers are growing rather
  11. rapidly.  This information is then converted into entries for each
  12. tech report with hypertext anchors to the TR itself, producing a
  13. really big file.  This file is then searchable for keywords by a
  14. Simple Index Keyword Search (SIKS).  I believe it represents a
  15. potentially nicer general interface to this informational resources
  16. than existing methods (e.g. WAIS pointers to ftp sites).  It certainly
  17. is not the ultimate information browsing tool, but I hope it may push
  18. the migration towards such a little.
  19.  
  20. Note that this index only maintains pointers to papers that are
  21. available online by a simple mouse click within XMosaic; following a
  22. link will not entail walking to your local library or sending somebody
  23. a check.  I do not know of any other indexing system for CS papers
  24. which is this large and which easily allows direct network access to
  25. the documents themselves.
  26.  
  27. HOW TO USE IT
  28.  
  29. The URL is:
  30.  
  31.     http://cs.indiana.edu/cstr/search
  32.  
  33. LIMITATIONS
  34.  
  35. This is still highly experimental, but I wanted to mention its
  36. existence to the world so people can start to play around with it.
  37.  
  38. I'm sure there are some sites that archive TRs and the like that
  39. aren't included in the TR listings I got my hands on.  I'm not even
  40. done looking through the listings I have yet, so please don't bombard
  41. me with random names of archive sites not yet indexed just now unless
  42. you are the maintainer of one.
  43.  
  44. There are a lot of different archive sites, and thus there are a lot
  45. of different file formats for the indexes.  Some sites don't have an
  46. index at all.  Some sites have file structures that are not easy to
  47. grok.  The daemon I have written understands several different types
  48. of indexing, but does so in a rather crude way; thus, the results are
  49. typically functional but may not always look pretty.  If you don't
  50. like this, then you'll have to go out and persuade every site that
  51. archives TRs to agree on a standardized index file format.  Good luck;
  52. should take about 10 years. :-) If you would just like one specific
  53. site (say, yours) to look a little nicer, write some code in perl to
  54. do so and send it to me and I'll see what I can do.
  55.  
  56. Obviously, if an FTP site happens to be down when the index is made,
  57. its stuff won't be in there.  Other errors (e.g. typos in index files)
  58. can cause problems, but I can't really fix them.  Since the index file
  59. is so large, obviously I don't check all (or even very many) of the
  60. entries in it.
  61.  
  62. There are some sites with rather non-helpful filenames.  For example,
  63. the Xmosaic browser will automatically pop up a PostScript previewer
  64. if the filename ends with .ps (or .ps.Z or the like); however, some
  65. sites have PostScript files without that name.  Not much I can do
  66. about that.
  67.  
  68. Anyway, give it a try.  Feel free to send constructive criticisms,
  69. praise, or lavish gifts.
  70.  
  71. - Marc
  72.